由于空气的精致抗原特异性,个人的适应性免疫受体(空气)曲目记录了免疫病史。阅读此记录需要从序列中推断受体功能的计算方法,因为可能受体 - 抗原对的多样性大大超过了实验知识。鉴定具有相似序列的空气,因此在这些方法中是常见的性能瓶颈。在这里,我们基于基于半径的搜索Levenshtein邻居的五种不同算法方法的时间复杂性。我们表明,最初提出的用于拼写检查的对称删除查找方法特别可扩展。然后,我们引入Xtneighbor,这是该算法的一种变体,可以在GPU上大规模平行。对于一百万个输入序列,Xtneighbor识别了所有序列邻居,这些序列邻居在商品硬件上最多差异两个编辑,比现有方法快的数量级。我们还展示了对称删除查找如何使用更复杂的序列相似性指标(例如TCRDIST)加快搜索。我们的概述将大大加快现有分析管道的速度,并能够处理大规模的免疫测序数据而不会降采样。
主要关键词
![arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第1页](/bimg/6/651cbf84ddda6f9d02ec104a97d58416d88f233f.webp)
![arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第2页](/bimg/5/5cc7079e4b992a362d2a578adcdfbfdae951f844.webp)
![arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第3页](/bimg/5/5e871cf6d072a5aa1155f34f091116728ea8e7af.webp)
![arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第4页](/bimg/4/4600489185c40e679496f3f6a721e5625bced710.webp)
![arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第5页](/bimg/4/4aa1a2488515c9bb47f68901d426c30ab31840b6.webp)
